Не нужно много, чтобы заставить алгоритмы машинного обучения пойти наперекосяк. Появление крупноязыковых моделей может усугубить проблему
Алгоритмы, лежащие в основе современных систем искусственного интеллекта (ИИ), нуждаются в большом количестве данных для обучения. Большая часть этих данных поступает из открытой сети, что, к сожалению, делает сайт уязвимым для кибератак, известных как «отравление данных».
Это означает изменение или добавление лишней информации в набор обучающих данных, чтобы алгоритм научился вредному или нежелательному поведению. Подобно настоящему яду, отравленные данные могут оставаться незамеченными до тех пор, пока не будет нанесен ущерб.
Отравление данными — не новая идея.
В 2017 году исследователи продемонстрировали, как такие методы могут привести к тому, что системы компьютерного зрения для беспилотных автомобилей, например, ошибочно принимают знак остановки за знак ограничения скорости. Но насколько осуществима такая уловка в реальном мире, было неясно.
Когда-то двусторонние переводы были бесконечным источником юмора. Некоторые люди брали серьезные тексты и подвергали их этому двустороннему процессу, что давало забавные результаты.
И плохой компьютеризированный перевод вряд ли ушел в прошлое.
Вывески «чинглиш» до сих пор вызывают улыбки у англоговорящих посетителей китайскоязычного мира.
Тем не менее, для большинства повседневных целей машинный перевод (MT) стал намного лучше за последние пять лет или около того.
Самым большим источником улучшений стало развертывание «глубокого обучения» при обучении таких систем, которые предназначены для имитации действия нейронов мозга.
Но усовершенствование автоматизированного перевода для бизнес-целей также произошло за счет увеличения числа умных компаний, решающих индивидуальные задачи.
22-25 мая. Деловые события Москвы. Участие бесплатно (кроме первовго эвента).
t.me/SmartEventMos Список деловых событий Москвы.
t.me/kudaidem — Инвестидеи. Новости бизнеса. Обзоры деловой литературы.
22-24 мая 2019 г. Конференция Russian Tech Week 2019. Более 100 спикеров расскажут об инновационных технологиях для решения задач бизнеса и продемонстрируют реальные кейсы. Бронь места с 10% скидкой по промокоду: IFPCRTW-SMARTEVENT на сайте: bit.ly/2JFTRYg
22-23 мая 2019 Первый предпринимательский Open Air #МыЕсть в рамках Столыпинского форума: Стратегии для России stolypinforum.ru/
23 мая 16:30 до 22:00 StartUp Show startupshow.ru/mbm
23-24 мая Маркетинг и ML. Митап по применению AI & Big Data в маркетинге mlmeetup.timepad.ru/event/966582/
24-25 мая Будущее по Марксу marx.msses.ru/
25 мая c 16:00 до 17:30 Книжный клуб с Ксенией Лурье: Встреча 9. Лили Кинг «Эйфория» fgbuk-gmvts-rosizo.timepad.ru/event/966331/
Список ВСЕХ деловых событий Москвы goo.gl/h9MiUi Вкладка: ЭВЕНТЫ
P.S. t.me/kudaidem — Новости бизнеса. Обзоры деловой литературы.
Система Quill способна практически мгновенно формировать бизнес-отчеты с заданной периодичностью — и все это без вмешательства человека http://narrativescience.com
Пример технологии Quill (Система написания нарративных текстов) демонстрирует, насколько уязвимыми для автоматизации оказываются задачи, которые когда-то считались исключительной прерогативой высококвалифицированных профессионалов с высшим образованием. Опрос экспертов: «Какой будет доля новостных материалов, написанных с помощью программных алгоритмов, в ближайшие 5 лет. Ответ: более 90 %»
Деятельность компании Target, Inc. является примером куда более спорного подхода к использованию огромных массивов чрезвычайно подробных данных. Компания с очень большой долей вероятности предсказывать наличие беременности на раннем сроке у покупательниц на основе анализа продаж по двадцати пяти различным видам косметической и медицинской продукции. Проводимый компанией анализ был настолько точным, что даже позволял с высокой степенью точности определять срок беременности у конкретной женщины. Получив эти данные, сотрудники Target начинали забрасывать женщин предложениями о покупке товаров для беременных, да еще и на столь раннем сроке, что во многих случаях ближайшее окружение женщины даже не знало о ее положении.